*ARTIGO TUTORIAL-REGRESSÃO LINEAR MÚLTIPLA
*Abrir dataset
*repositório Harvard Dataverse-Guilherme Pinho Ferreira DATAVERSE

*Fazer estatística descritiva
sum funcionarios lojas checkouts areadevendas faturamento

*Fazer box plots 
graph hbox funcionarios
graph hbox lojas
graph hbox checkouts
graph hbox areadevendas
graph hbox faturamento

*Gráfico de dispersão:
scatter funcionarios lojas
scatter funcionarios checkouts
scatter funcionarios areadevendas
scatter funcionarios faturamento

*Estimar regressao linear múltipla:
reg funcionarios lojas checkouts areadevendas faturamento

*Análise de resíduos
rvfplot, yline(0)

*Distância de Leverage
lvr2plot, mlabel(empresa)

*Winsorizar a variável antes de estimar o modelo
*Instalar o módulo winsor se necessário
ssc install winsor

*Winsorizar modificando 2% das observações em cada cauda
winsor funcionarios, gen(funcionariosw) p(0.02)

*Estimar o modelo de regressão com a variável winsorizada
reg funcionariosw lojas checkouts areadevendas faturamento

*Processar correlação
pwcorr funcionariosw lojas checkouts areadevendas faturamento, star(0.05)

*Calcular VIF
vif

*Estimar novo modelo de regressão com a variável winsorizada, excluindo as variáveis areadevendas e faturamento
reg funcionariosw lojas checkouts

*Calcular VIF, após exclusão das variáveis areadevendas e faturamento
vif

*modelo de regressão para realizar o teste reset
reg funcionariosw lojas checkouts

*Teste Reset
ovtest

*Teste de heterocedasticidade
hettest

*Estimar regressão pelo estimador robusto de White
reg funcionariosw lojas checkouts, rob

*Processar Linktest
linktest

*cálculo do coeficiente padronizado
reg, beta

